MIT研究：AI聊天機器人對弱勢用戶表現較差部分回應更不準確甚至帶貶抑語氣 - 職趣事 - JobMarket求職廣場

職趣事

Home>職趣事>MIT研究：AI聊天機器人對弱勢用戶表現較差部分回應更不準確甚至帶貶抑語氣

MIT研究：AI聊天機器人對弱勢用戶表現較差部分回應更不準確甚至帶貶抑語氣

02 Mar 2026

人工智能聊天機器人近年被視為打破資訊壁壘的重要工具，理論上能為不同背景、不同地區的人士提供平等的知識支援。然而，美國麻省理工學院（MIT）一項最新研究指出，主流大型語言模型（LLM）在面對英語能力較低、教育程度較低或來自美國以外地區的用戶時，回應質素明顯下降，甚至更頻繁拒絕作答，部分情況下更出現居高臨下或帶有嘲諷意味的語氣。

測試GPT-4、Claude 3 Opus與Llama 3

是次研究由MIT媒體實驗室（MIT Media Lab）旗下「建設性溝通中心」（Center for Constructive Communication，CCC）進行，測試對象包括OpenAI的GPT-4、Anthropic的Claude 3 Opus，以及Meta的Llama 3三款主流AI模型。

研究團隊使用TruthfulQA與SciQ兩個常見測試數據集，前者主要評估模型的真實性與辨識錯誤資訊能力，後者則為科學考題數據集，用以測試事實準確度。研究人員在每條問題前加入不同「用戶簡歷」，模擬用戶的教育程度、英語熟練度及國籍背景，藉此觀察模型是否因用戶特徵而改變回應質素。

準確率在弱勢組別顯著下跌

研究結果顯示，當問題來自「英語非母語者」或「教育程度較低」的用戶時，三款模型的準確率均出現明顯下跌；若兩種特徵同時存在，即「教育程度較低的非英語母語者」，回應質素下滑最為嚴重。

此外，在國籍測試方面，研究團隊比較來自美國、伊朗及中國、且教育程度相同的用戶情境，發現Claude 3 Opus在面對來自伊朗的用戶時，於兩個數據集中均出現更顯著的準確率下降。

研究人員指出，這些差異反映模型在不同人口特徵交織下，可能產生「複合性不利影響」，令本身已在資訊取得上較為弱勢的群體，進一步面臨資訊質素下降的風險。

拒答比例更高　部分回應帶貶抑語氣

研究亦發現「拒答行為」（refusal behavior）在弱勢組別中特別明顯。例如Claude 3 Opus對教育程度較低、英語非母語者的問題，拒絕回答比例接近11%；相比之下，未附帶用戶背景資料的對照組僅為3.6%。

更值得關注的是，研究人員對拒答內容進行人工審視後發現，當用戶被描述為教育程度較低時，約43.7%的拒答回應包含貶抑、居高臨下或嘲諷語氣；而在高教育程度組別中，相關比例不足1%。部分情況下，模型甚至模仿「破碎英語」或誇張口音作回應。

此外，模型亦曾在特定用戶背景下拒絕回答有關核能、人體解剖或歷史事件等問題，但對其他用戶則提供正確答案。研究人員指出，這或與模型在「對齊訓練」（alignment）過程中，為避免潛在錯誤資訊風險，而對某些用戶採取過度保守策略有關。

反映人類社會偏見模式

研究指出，這種現象與社會科學中記錄的人類認知偏見相似。過往研究顯示，母語為英語者往往傾向認為非母語者較不聰明或能力較低，即使對方實際專業能力並無差異。類似偏見亦見於教師對非英語母語學生的評估。

MIT CCC研究人員強調，若大型語言模型未妥善處理這些潛在偏見，將有可能在全球大規模應用下，無形中加劇資訊不平等。

個人化功能或放大差距

隨着聊天機器人愈來愈強調「個人化」功能，例如追蹤用戶背景與對話紀錄的記憶系統，研究團隊警告，若模型已存在針對特定群體的系統性差異，個人化技術或會進一步放大這些不平等。

研究作者指出，大型語言模型原被視為推動教育公平與資訊普及的重要工具，但若弱勢用戶反而更容易收到錯誤、拒答或帶有偏見的回應，相關技術或將無法實現其「資訊民主化」的初衷。

研究論文題為《LLM Targeted Underperformance Disproportionately Impacts Vulnerable Users》，並已於今年1月在AAAI人工智能會議上發表。

專家呼籲，科技公司在推動人工智能普及的同時，須持續檢視模型是否存在隱性偏見，並加強公平性測試與監管機制，以免令最需要資訊支援的人士，反而成為科技進步下的「盲點」。

好工推介

Legal Assistant / Legal Clerk	Everstar Merchandise Co Ltd	28 May 2026
二手精英地產代理	Century 21 Luen Shing Property Consultants Limited 世紀21聯誠物業	19 May 2026
Legal & Account Clerk	Everstar Merchandise Co Ltd	15 May 2026
Property Officer	Leahander Investment Limited	11 May 2026
Logistic Coordinator	Fasty Asia Limited	08 May 2026

Senior Fashion Designer (Sweater)(Ref# 065709)	Easy Job Centre	04 Jun 2026
Fashion Designer (Sweater)(Ref# 065708)	Easy Job Centre	04 Jun 2026
Senior Merchandiser (Sweater)(Ref# 063049)	Easy Job Centre	04 Jun 2026
Merchandiser (Contract)(Ref# 066895)	Easy Job Centre	04 Jun 2026
Senior Merchandiser (Knit)(Ref# 049128)	Easy Job Centre	04 Jun 2026

Merchandiser (Knit)(Ref# 044587)	Easy Job Centre	04 Jun 2026
Assistant Fashion Graphic Designer (Ref# 066123)	Easy Job Centre	04 Jun 2026
Senior Merchandiser (Ref# 063596)	Easy Job Centre	04 Jun 2026
Merchandiser (Woven / Knit)(Ref# 029150)	Easy Job Centre	04 Jun 2026
Temporary Merchandiser (Sweater)(Ref# 068574)	Easy Job Centre	04 Jun 2026

Merchandiser (Sweater)(Ref# 064445)	Easy Job Centre	04 Jun 2026
Lead Sourcing Specialist (Knit)(Ref# 068583)	Easy Job Centre	04 Jun 2026
Merchandiser (Woven)(Ref# 046986)	Easy Job Centre	04 Jun 2026
Assistant Merchandiser (Woven)(Ref # 047701)	Easy Job Centre	04 Jun 2026
Assistant Merchandiser (Woven/Knit)(Ref# 064850)	Easy Job Centre	04 Jun 2026

Tag cloud:

好工推介

其他相關新聞

本港3.6萬青年屬尼特族 佔整體青年人口約6.3％ 有議員促請當局採取措施提高青年就業率

退休活到100歲要幾多錢？研究：每月退休開支2萬元 需要660至710萬儲蓄

AI預算愈加愈多 回報卻未見同步增長？調查：近四成企業節省成本不足一成

Team Building文化改變？近半年輕同事拒絕「Happy Hour」 盼聚會應酬告別酒精文化

澳洲調查：三成打工仔工作期間如廁玩手機 男性比例較高 近半人未有清潔共用設備

月入10萬元專業人士失業7個月零Offer 朋友勸考的士牌遭拒：放唔低身段？

AI時代的人才解碼： 聖方濟各大學首屆人力資源論壇 聚焦人本智能 掌握職場新格局

幼師轉行任理財顧問 以耐心及親和力 打動人心

從文創老闆到理財新秀 內地高才來港 開啟事業新篇

在職媽媽轉換跑道 靈活兼顧事業與家庭

【政府工速遞】司法機構聘請司法書記 月薪最高可達59,110元 DSE5科3級可申請！

港漂留港創理財事業 細心服務獲客戶青睞

薪酬趨勢調查出爐 高層淨指標4.12％ 10月起引入「拉Curve」機制 最少5％不獲跳Point

薪酬透明化成大勢 企業難再「收收埋埋」 Robert Walters報告：員工更重視公平與信任

AI浪潮下怕飯碗不保？ 專家教你6招提升職場競爭力

在職家庭及學生資助事務處招聘調查主任 月薪$35,380、中學學歷可申請、需8年行政經驗

探索瑞士Top 10大學管理學科 開啟跨界職涯的「全能通行證」

失業後狂碌招聘網站停不了？打工仔掀「沉迷揾工」現象 愈揾愈焦慮

都大學術質素獲國際肯定 多元應用課程重實戰 助畢業生掌握職場優勢

同事成日話唔識 其實係卸膊伎倆？「將無能當武器」累死好員工 專家傳授6招自救心法

好工搜尋

Account & Audit

Administration, Clerical & Secretary

Banking & Financial Services

Building & Construction

Catering (Food & Beverage)

Design

Education & Training

Engineering / Tech

Entertainment / Production

Executive & Management

Government, Public Utilities & NGO

Health & Beauty Care

Hotel & Hospitality

Human Resources

Information Technology

Insurance

Logistics, SCM & Transportation

Manufacturing

Marketing & Public Relations

Media & Advertising

Medical Services

Merchandising / Purchasing

Professional & Legal Services

Property / Estate

Sales, CS & Business Development

Sciences, Lab, R&D

Tourism, Travel Agency & Airline

Others

職場熱話

JobMarket

Jobseeker

Recruiter

Mobile app

JobMarket Magazine

Advertising Hotline : +852 3181 3181

Customer Service Hotline : +852 3181 3322

本港3.6萬青年屬尼特族佔整體青年人口約6.3％有議員促請當局採取措施提高青年就業率

退休活到100歲要幾多錢？研究：每月退休開支2萬元需要660至710萬儲蓄

AI預算愈加愈多回報卻未見同步增長？調查：近四成企業節省成本不足一成

Team Building文化改變？近半年輕同事拒絕「Happy Hour」盼聚會應酬告別酒精文化

澳洲調查：三成打工仔工作期間如廁玩手機男性比例較高近半人未有清潔共用設備

AI時代的人才解碼：聖方濟各大學首屆人力資源論壇聚焦人本智能掌握職場新格局

幼師轉行任理財顧問以耐心及親和力打動人心

從文創老闆到理財新秀內地高才來港開啟事業新篇

在職媽媽轉換跑道靈活兼顧事業與家庭

【政府工速遞】司法機構聘請司法書記月薪最高可達59,110元 DSE5科3級可申請！

港漂留港創理財事業細心服務獲客戶青睞

薪酬趨勢調查出爐高層淨指標4.12％ 10月起引入「拉Curve」機制最少5％不獲跳Point

薪酬透明化成大勢企業難再「收收埋埋」 Robert Walters報告：員工更重視公平與信任

AI浪潮下怕飯碗不保？專家教你6招提升職場競爭力

在職家庭及學生資助事務處招聘調查主任月薪$35,380、中學學歷可申請、需8年行政經驗

探索瑞士Top 10大學管理學科開啟跨界職涯的「全能通行證」

失業後狂碌招聘網站停不了？打工仔掀「沉迷揾工」現象愈揾愈焦慮

都大學術質素獲國際肯定多元應用課程重實戰助畢業生掌握職場優勢

同事成日話唔識其實係卸膊伎倆？「將無能當武器」累死好員工專家傳授6招自救心法